\section*{习题三}

1. 设 \({\sigma }_{j},j = 1,2,\ldots ,m\) 为 \(m\) 个正实数,

\[
f\left( {{\alpha }_{1},{\alpha }_{2},\ldots ,{\alpha }_{m}}\right)  = \frac{{\sigma }_{1}^{2}}{{\alpha }_{1}} + \frac{{\sigma }_{2}^{2}}{{\alpha }_{2}} + \cdots  + \frac{{\sigma }_{m}^{2}}{{\alpha }_{m}},\left( {{\alpha }_{1},\ldots ,{\alpha }_{m}}\right)  \in  {\left( 0,1\right) }^{m},
\]

{\color{red}\textbf{[关键思路]:} 这是带约束的优化问题——用拉格朗日乘数法,引入乘数 \(\lambda\) 处理约束 \({\alpha }_{1} + \cdots  + {\alpha }_{m} = 1\) 。注意最优解中 \({\alpha }_{j}\) 与 \({\sigma }_{j}\) 成正比,这反映了``方差大的分量应分配更多权重''的直觉。}

则在 \({\alpha }_{1} + {\alpha }_{2} + \cdots  + {\alpha }_{m} = 1\) 条件下 \(f\left( {{\alpha }_{1},{\alpha }_{2},\ldots ,{\alpha }_{m}}\right)\) 的最小值点为

\[
{\alpha }_{j} = \frac{{\sigma }_{j}}{\mathop{\sum }\limits_{{k = 1}}^{m}{\sigma }_{k}},j = 1,2,\ldots ,m
\]

最小值为 \({\left( {\sigma }_{1} + \cdots  + {\sigma }_{m}\right) }^{2}\) 。

{\color{red}\textbf{[联系]:} 这个结果在分层抽样中至关重要——它告诉我们如何在各层之间最优分配样本量,使得方差估计的总方差最小。}

2. 考虑定积分

\[
I = {\int }_{-1}^{1}{e}^{x}{dx} = e - {e}^{-1}.
\]

{\color{red}\textbf{[提示]:} 这道题要求对同一积分使用四种不同方法——随机投点法最简单但效率最低;平均值法利用期望值;重要抽样法需选择与 \({e}^{x}\) 形状接近的重要性密度;分层抽样法要将 \(\left[ {-1,1}\right]\) 分层以减小方差。}

(1)用随机模拟方法计算定积分 \(I\) ,分别用随机投点法、平均值法、重要抽样法和分层抽样法计算。

{\color{red}\textbf{[关键]:} 对于重要抽样,注意被积函数 \({e}^{x}\) 在 \(\left[ {-1,1}\right]\) 上不对称——右侧值更大。选择重要性密度时可考虑指数分布或截断的指数密度,使其与 \({e}^{x}\) 的形状匹配。}

(2)设估计结果为 \(\widehat{I}\) ,如果需要以 \({95}\%\) 置信度保证计算结果精度在小数点后三位小数, 这四种方法分别需要计算多少次被积函数值?

{\color{red}\textbf{[解题思路]:} 精度要求``小数点后三位''意味着误差 \(\left| {\widehat{I} - I}\right|  < 0.0005\) 。利用中心极限定理,在 \({95}\%\) 置信度下需要 \(1.96 \times \sigma /\sqrt{n} < 0.0005\) ,从而得到所需样本量 \(n \geq {\left( 1.96\sigma /0.0005\right) }^{2}\) 。关键是估计每种方法的方差 \({\sigma }^{2}\) 。}

( 3 )用不同的随机数种子重复以上的估计 \(B\) 次,得到 \({\widehat{I}}_{j},j = 1,2,\ldots ,B\) ,由此估计 \(\widehat{I}\) 的抽样分布方差,与(2)的结果进行验证。

{\color{red}\textbf{[实验验证]:} 这是蒙特卡罗模拟的标准验证策略——通过重复实验 \(B\) 次,用样本方差 \(\frac{1}{B - 1}\mathop{\sum }\limits_{{j = 1}}^{B}{\left( {\widehat{I}}_{j} - \bar{I}\right) }^{2}\) 估计理论方差,检验理论预测是否准确。}

(4) 称

\[
\operatorname{MAE}\left( \widehat{I}\right)  = E\left| {\widehat{I} - I}\right|
\]

为 \(\widehat{I}\) 的平均绝对误差。从 (3) 得到的 \({\widehat{I}}_{j},j = 1,2,\ldots ,B\) 中估计 \(\operatorname{MAE}\left( \widehat{I}\right)\) 。比较这四种积分方法的平均绝对误差大小。

{\color{red}\textbf{[方法比较]:} 预期结果应该是:随机投点法效率最低(需样本量最大),平均值法次之,重要抽样和分层抽样显著更优。这道题的核心是理解方差缩减技术的实际效果——好的方法可以将所需样本量减少 \(10 - {100}\) 倍!}
